به گزارش شهرآرانیوز، پژوهشگران شرکت مایکروسافت در آسیا از یک ابزار هوش مصنوعی جدید به نام VASA-1 رونمایی کردهاند. این ابزار نوآورانه میتواند، با استفاده از یک تصویر ثابت یا حتی طرحی از فرد و یک فایل صوتی موجود، بهصورت لحظهای چهرهای متحرک و بسیار واقعی بسازد. هوش مصنوعی جدید مایکروسافت قادر است براساس فایل صوتی (مانند سخنرانی یا آهنگ)، حرکات لب و حالات چهره و چرخش سر را برای تصویر یا طرح اولیه تولید کند. پژوهشگران نمونههای فراوانی را در صفحه پروژه بهاشتراک گذاشتهاند که چنان طبیعی بهنظر میرسند که میتوانند بهراحتی مخاطب را فریب دهند.
شاید اگر با دقت زیادی نمونههای منتشرشده را بررسی کنید، متوجه کمی تصنع یا نامتناسببودن حرکات لب و سر شوید، اما همچنان واضح است که این فناوری میتواند بهسادگی و با سرعت برای ساخت ویدئوهای دیپ فیک افراد واقعی مورد سوءاستفاده قرار بگیرد. خود پژوهشگران نیز از این پتانسیل آگاه هستند و تصمیم گرفتهاند، تا زمانی که از «استفاده مسئولانه و مطابق با قوانین» این فناوری اطمینان حاصل نکنند، از عرضه «دموی آنلاین، رابط برنامهنویسی کاربردی، محصول نهایی، جزئیات بیشتر در مورد پیادهسازی، یا هرگونه خدمات مرتبط» خودداری کنند. با این حال، آنها نگفتند که آیا اقدامات حفاظتی خاصی را برای جلوگیری از سوءاستفاده افراد (مانند ساخت هرزهنگاری جعلی یا راهاندازی کمپینهای اطلاعات غلط) در نظر گرفتهاند یا نه.
پژوهشگران بر این باورند که این فناوری هوش مصنوعی، فراتر از پتانسیلهای مخرب خود، مزایای فراوانی دارد. آنها گفتهاند که VASA-1 میتواند برای ارتقای برابری آموزشی و همچنین بهبود دسترسی افراد با چالشهای ارتباطی مفید باشد؛ برای مثال، افراد میتوانند آواتاری داشته باشند که بهجایشان صحبت کند. آنها همچنین اشاره کردهاند که این فناوری میتواند برای کسانی که نیاز به همراهی و حمایت درمانی دارند مؤثر باشد. این نشان میدهد که VASA-1 میتواند در برنامههایی که امکان برقراری ارتباط با شخصیتهای هوش مصنوعی را فراهم میکنند بهکار گرفته شود.
طبق مقاله منتشرشده همراه با معرفی این ابزار، VASA-1 با استفاده از مجموعهداده VoxCeleb2 آموزش دیده است. این مجموعه شامل «بیش از یکمیلیون جمله صوتی برای ۶۱۱۲ فرد مشهور» است که از ویدئوهای یوتیوب استخراج شدهاند. جالب اینجاست که این ابزار، با وجود آموزش روی چهرههای واقعی، روی تصاویر هنری (مانند نقاشی چهره مونالیزا) نیز کار میکند. پژوهشگران، برای نمایش قابلیتهای VASA-1، آن را با فایل صوتی اجرای معروف و وایرال آن هتوی از آهنگ Paparazzi، اثر لیل وین، نیز ترکیب کردهاند. این خروجی چنان سرگرمکننده است که حتی اگر درباره فواید چنین فناوریای تردید داشته باشید ارزش دیدن دارد. این ویدئو را در زیر ببینید:
منبع: گجتنیوز